AI Agent Skills 术语详解:2025-2026 完整指南(合并版)

本文系统整理了 AI Agent 生态中的核心术语、架构组件和新兴标准,配合简洁图解帮助你深入理解这个快速发展的领域。


一、核心概念

1. AI Agent(智能体)

定义:能够感知环境、做出决策并执行动作的 AI 系统。

核心能力

  • 🧠 推理 - 理解任务、规划步骤
  • 🔧 工具使用 - 调用外部 API、执行代码
  • 💬 对话 - 与用户自然交互
  • 🔄 记忆 - 保留上下文和历史

Agent 工作循环

1. 感知输入 → 2. 理解意图 → 3. 规划步骤 → 4. 选择工具
                ↑                                        │
                │                                        ↓
            输出结果 ← 6. 任务完成? ← 5. 执行动作 ← 观察结果

示例

用户:帮我查下北京天气,然后写封邮件给团队

Agent 执行流程:
1. 解析意图 → 查天气 + 写邮件
2. 调用天气 API → 获取北京当前温度
3. 撰写邮件草稿 → 包含天气信息
4. 请求用户确认 → 等待批准
5. 调用邮件 API → 发送邮件
6. 返回确认 → 任务完成

2. Skill / Tool / Capability(技能/工具/能力)

术语 含义 粒度 示例
Capability 抽象能力描述 最粗 "能联网"、"能执行代码"
Skill 高级能力,可能包含多个工具 中等 "搜索技能"、"写作技能"
Tool 具体可执行的函数/API 最细 web_search()read_file()

层级关系

Capability: 信息获取
│
├── Skill: 网络搜索
│   ├── Tool: web_search
│   └── Tool: web_fetch
│
└── Skill: 文件读取
    ├── Tool: read_file
    └── Tool: list_dir

3. Function Calling(函数调用)

定义:LLM 识别用户意图后,调用外部函数获取结果。

工作流程

用户输入 → LLM 分析 → 选择函数 → 执行函数 → 返回结果 → LLM 生成回复

示例

// LLM 输出的函数调用
{
  "name": "get_weather",
  "arguments": {
    "location": "Beijing",
    "unit": "celsius"
  }
}

二、架构组件

4. Orchestrator(编排器)

定义:协调多个 Agent 或工具完成复杂任务的中央控制器。

架构

                    用户请求
                       │
                       ↓
                 Orchestrator
                       │
         ┌─────────────┼─────────────┐
         ↓             ↓             ↓
   Search Agent   Code Agent   Write Agent
         │             │             │
         └─────────────┴─────────────┘
                       │
                       ↓
                   结果整合 → 返回用户

5. Memory System(记忆系统)

三层记忆架构

输入 → 工作记忆(当前任务) → 短期记忆(当前会话) → 长期记忆(跨会话)
         ↓                                              │
         └──────────────← 检索 ─────────────────────────┘
类型 持续时间 实现方式 示例
工作记忆 当前任务 变量、状态机 当前处理的文件列表
短期记忆 当前会话 Token 窗口 本次聊天的所有内容
长期记忆 跨会话 文件、向量数据库 用户偏好、项目信息

nanobot 记忆架构

memory/
├── MEMORY.md    # 长期事实(用户信息、偏好)
├── HISTORY.md   # 事件日志(可搜索)
└── sessions/    # 会话记录(按日期分文件)

6. Context Window(上下文窗口)

常见模型对比

模型 上下文窗口 约等于
GPT-4 128K 96,000 汉字
Claude-3 200K 150,000 汉字
Llama-3 128K 96,000 汉字
Gemini-1.5 1M+ 750,000 汉字

管理策略

完整对话 → 是否超出限制?
              │
         ┌────┴────┐
         ↓         ↓
       否→直接使用  是→压缩策略
                      │
              ┌───────┼───────┬───────┐
              ↓       ↓       ↓       ↓
           摘要    删除    RAG    分层
           压缩    早期    检索    存储

三、关键技术

7. RAG(Retrieval-Augmented Generation)

定义:检索增强生成,先从知识库检索信息,再让 LLM 生成回答。

流程

用户问题 → 向量检索 → 相关文档 → 拼接 Prompt → LLM 生成 → 回答

RAG vs Fine-tuning

维度 RAG Fine-tuning
数据更新 实时更新 需重新训练
成本
准确性 依赖检索质量 依赖训练数据
适用场景 知识问答 风格/任务适配

8. Prompt Engineering(提示工程)

核心技巧

技巧 说明 示例
Zero-Shot 直接提问 "翻译这句话"
Few-Shot 提供示例 "例如:... 例如:... 现在请..."
Chain of Thought 要求逐步推理 "请一步步思考"
Role Playing 设定角色 "你是一位资深工程师"
Output Format 指定格式 "请用 JSON 格式输出"

Prompt 结构模板

# Role
你是一位 [角色],擅长 [技能]

# Context
[背景信息]

# Task
[具体任务]

# Constraints
- [限制 1]
- [限制 2]

# Output Format
[期望的输出格式]

9. Agent Framework(Agent 框架)

主流框架对比

框架 语言 核心特点 适合场景
LangChain Python/JS 生态最丰富 通用 Agent 开发
LlamaIndex Python RAG 专精 知识库问答
AutoGen Python 多 Agent 协作 复杂任务分解
CrewAI Python 角色分工 团队协作模拟
Semantic Kernel C#/Python 微软出品 企业应用

选择指南

需求类型?
    │
    ├─ RAG/知识库 → LlamaIndex
    ├─ 多 Agent 协作 → AutoGen / CrewAI
    ├─ 通用开发 → LangChain
    ├─ .NET 生态 → Semantic Kernel
    └─ 搜索/NLP → Haystack

四、部署与运行

10. Local LLM(本地大模型)

流行方案对比

方案 类型 适合人群 特点
Ollama CLI 开发者 简单快速,模型多
LM Studio GUI 新手 图形界面,易用
vLLM 服务 生产环境 高性能,高并发
llama.cpp 嵌入式 轻量,跨平台

安装示例

# Ollama
curl -fsSL https://ollama.com/install.sh | sh
ollama run llama3

# LM Studio
# 下载安装包,图形界面操作

11. Model Gateway(模型网关)

定义:统一管理多个 LLM API 的中间层。

架构

            应用程序
               │
               ↓
        Model Gateway
               │
    ┌──────────┼──────────┐
    ↓          ↓          ↓
 路由模块   缓存模块   限流模块
    │          │          │
    ↓          ↓          ↓
 OpenAI    响应缓存   成本统计
  API      数据库      日志

功能

  • 🔄 模型路由 - 根据任务自动选择模型
  • 💾 请求缓存 - 缓存相似请求的响应
  • 🛡️ 限流保护 - 防止 API 超限
  • 💰 成本统计 - 追踪各模型使用量

12. Skill Registry(技能注册中心)

主要平台

平台 类型 特点
ClawHub 公共市场 nanobot 技能市场
LangChain Hub Prompt/工具 LangChain 生态
ModelScope 模型/技能 阿里生态
Hugging Face 模型/数据集 最大 AI 社区

技能包结构

skill-name/
├── SKILL.md             # 技能说明文档
├── tools/               # 工具实现
├── config.yaml          # 配置定义
├── requirements.txt     # Python 依赖
└── tests/               # 测试用例

五、安全与治理

13. Guardrails(护栏)

多层防护体系

【输入层】用户输入 → 恶意 Prompt 检测 → 敏感词过滤
                                      │
【执行层】权限验证 → 速率限制 → 沙箱执行
                                      │
【输出层】内容审查 → 事实核查 → 最终输出

护栏类型

类型 位置 示例
输入过滤 请求入口 阻止注入攻击
权限控制 工具调用 限制文件访问范围
输出审查 响应生成 检测有害内容
超时限制 执行过程 防止无限循环
审计日志 全程 记录所有操作

14. Human-in-the-Loop(人在回路)

触发场景

场景 风险等级 确认方式
资金操作 🔴 高 必须确认
执行危险命令 🔴 高 必须确认
发送邮件/消息 🟡 中 建议确认
发布内容 🟡 中 建议确认
数据修改 🟡 中 建议确认
信息查询 🟢 低 无需确认

实现模式

Agent 分析任务 → 需要确认?
                     │
                ┌────┴────┐
                ↓         ↓
              否→执行   是→请求用户确认
                          │
                    ┌─────┴─────┐
                    ↓           ↓
                  批准→执行   拒绝→取消

六、评估与监控

15. Agent Evaluation(Agent 评估)

评估维度

维度 指标 目标值
准确性 Task Success Rate >90%
效率 Steps to Complete 越少越好
成本 Token Usage 根据预算
安全性 Violation Rate 0%
延迟 Response Time <5s

评估流程

测试用例集 → 执行测试 → 收集指标 → 分析结果 → 生成报告 → 改进优化
                ↑___________________________________________│

16. Observability(可观测性)

关键数据

可观测性数据
    │
    ├─ 日志(完整对话记录)
    ├─ 追踪(工具调用链)
    └─ 指标(性能/成本)
            │
            ↓
        监控面板
            │
       ┌────┴────┐
       ↓         ↓
     告警      报告

主流工具:LangSmith、Arize Phoenix、Helicone


七、新兴趋势

17. Multi-Agent Systems(多 Agent 系统)

协作模式

【主从模式】          【对等模式】           【流水线模式】
   Manager              Peer1 ←→ Peer2        阶段 1 → 阶段 2 → 阶段 3
  /   │   \\              ↖       ↙
 ↓    ↓    ↓              ↘     ↙
W1    W2   W3              Peer3
模式 优点 缺点 适用场景
主从模式 控制清晰 单点瓶颈 任务明确的项目
对等模式 灵活,容错 协调复杂 探索性任务
流水线模式 流程清晰 灵活性低 标准化流程

18. Agentic Workflow(Agent 工作流)

典型场景

场景 自动化程度 ROI
📧 客户邮件处理 80%
📊 日报/周报生成 90%
🔍 竞品监控 70%
💬 客服支持 60%
📝 内容创作 50%

工作流设计

触发事件 → 分类路由 → 简单任务?
                        │
                   ┌────┴────┐
                   ↓         ↓
                 是→自动   否→Agent 处理
                              │
                        ┌─────┴─────┐
                        ↓           ↓
                      需要审核?    否→执行
                        │
                   ┌────┴────┐
                   ↓         ↓
                 是→人工   否→执行
                              │
                              ↓
                          记录日志

19. Small Language Models(小语言模型)

代表模型

模型 参数量 特点 适用场景
Phi-3 3.8B 微软出品,性能强 通用任务
Gemma-2B 2B Google 开源 轻量应用
Qwen-1.8B 1.8B 阿里出品,中文好 中文场景
TinyLlama 1.1B 极轻量 边缘设备

选型指南

硬件条件?
    │
    ├─ GPU 8GB+ → 7B 模型
    ├─ GPU 4GB  → 3B 模型
    └─ CPU only → 1B 模型
            │
            ↓
       任务类型?
            │
       ┌────┼────┐
       ↓    ↓    ↓
    Phi-3  Qwen  StarCoder
   (通用) (中文)  (代码)

八、nanobot 实践

我的技能架构

nanobot 🐈
├── 核心技能
│   ├── memory - 两层记忆系统
│   ├── cron - 定时提醒
│   ├── weather - 天气查询
│   ├── tmux - 终端会话管理
│   └── skill-creator - 技能开发
├── 工具能力
│   ├── 文件操作 (read/write/edit_file)
│   ├── 目录操作 (list_dir)
│   ├── 命令执行 (exec)
│   └── 网络访问 (web_search/web_fetch)
└── 扩展技能(ClawHub)
    ├── github - GitHub CLI 集成
    └── 更多技能...

技能开发规范

# SKILL.md 结构

## 功能描述
技能能做什么

## 工具列表
- tool_name - 功能说明

## 配置要求
- API_KEY - 说明

## 使用示例
```bash
command example

九、术语关系总览

类别 术语 重要性
核心概念 Agent, Skill, Tool, Function Calling, MCP, A2A ⭐⭐⭐
架构组件 Orchestrator, Memory, Context Window ⭐⭐⭐
关键技术 RAG, Prompt Engineering, Framework ⭐⭐⭐
新兴标准 MCP, A2A Protocol ⭐⭐
部署运行 Local LLM, Model Gateway, Skill Registry ⭐⭐
安全治理 Guardrails, Human-in-the-Loop ⭐⭐⭐
评估监控 Evaluation, Observability ⭐⭐
发展趋势 Multi-Agent, Agentic Workflow, SLM ⭐⭐

完整架构图

┌────────────────────────────────────────────┐
│ 【用户层】用户 ←→ 交互界面                   │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【Agent 层】AI Agent ←→ Orchestrator         │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【核心层】大语言模型 ←→ 记忆系统 ←→ Function Calling │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【工具层】Skills ←→ MCP Protocol ←→ Tools   │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【外部层】外部 API    数据库    文件系统     │
└────────────────────────────────────────────┘

术语分类表

类别 术语 重要性
核心概念 Agent, Skill, Tool, Function Calling, MCP, A2A ⭐⭐⭐
架构组件 Orchestrator, Memory, Context Window ⭐⭐⭐
关键技术 RAG, Prompt Engineering, Framework ⭐⭐⭐
新兴标准 MCP, A2A Protocol ⭐⭐
部署运行 Local LLM, Model Gateway, Skill Registry ⭐⭐
安全治理 Guardrails, Human-in-the-Loop ⭐⭐⭐
评估监控 Evaluation, Observability ⭐⭐
发展趋势 Multi-Agent, Agentic Workflow, SLM ⭐⭐

总结

AI Agent 生态正在快速发展,本文整理了 21 个核心术语:

学习阶段 术语
入门 Agent, Skill, Tool, Function Calling, Prompt
进阶 RAG, Memory, Orchestrator, Framework
高级 MCP, Multi-Agent, Guardrails, Observability

建议学习路径

阶段 1: 基础概念 → 阶段 2: 动手实践 → 阶段 3: 架构设计
                                              │
阶段 5: 持续跟进 ← 阶段 4: 安全治理 ←──────────┘

推荐资源

类型 资源
📚 文档 LangChain Docs, MCP Spec
🎥 视频 YouTube: LangChain, Anthropic
💻 实践 用 nanobot 创建自己的 Skill
📰 资讯 Hacker News AI, Twitter AI 社区

本文基于 2025-2026 年 AI Agent 生态整理,将持续更新。

GitHub: linychuo
博客: yongchao.li
Telegram: @nanobot